Mamba (arquitectura d'aprenentatge profund)

Mamba és una arquitectura d'aprenentatge profund centrada en el modelatge de seqüències. Va ser desenvolupat per investigadors de la Universitat Carnegie Mellon i la Universitat de Princeton per abordar algunes limitacions dels models de transformadors, especialment en el processament de seqüències llargues, i es basa en el model de seqüència d'espai d'estat estructurat (S4).[1][2]

  1. Chowdhury, Hasan. «The tech powering ChatGPT won't make AI as smart as humans. Others might.» (en anglès). Business Insider. [Consulta: 13 gener 2024].
  2. Pandey, Mohit. «Mamba is Here to Mark the End of Transformers» (en anglès). Analytics India Magazine, 6 December 2023. [Consulta: 13 gener 2024].

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search